在有外网条件的情况下,使用终端下载数据集的时候,有时候速度慢的感人
更有甚者只有 几十k ,按照这个速度下载,能下载几天,同时因为长时间下载和不稳定的网络非常有可能导致中断,致使下载失败,同时下载的时候由于已经创建了对应的文件,还需要删除原文件,重新从头下载
理论上,有科学上网的手段,同时网速足够的情况下,应该能有较快的下载速度,可惜在实际使用过程中,结果并不总是让人满意的。
经过网络上查找资料,有说使用 mwget 的,但是有时候也会没啥用,经过更多的资料研究,发现我们可以使用 Google colab 作为中转站,先将数据集下到 Google colab 中,然后上传 谷歌网盘 再从谷歌网盘中下载。
经过使用,下载速度从原先的 100+kb 提升到 colab 下载 5~8mb 然后 网盘下载 5~8mb 大大优化了原先下载时长。
1、登陆 Google colab
2、装载云端硬盘
新建 drive 文件夹,并且输入以下代码加载网盘
from google.colab import drive
drive.mount('/content/drive')3、根据需要执行下载命令
这里以 SoccerNet 数据集为例
首先添加代码
pip install SoccerNet等待安装完成后,再次添加代码块
from SoccerNet.Downloader import SoccerNetDownloader
mySoccerNetDownloader = SoccerNetDownloader(LocalDirectory="data/SoccerNetGS")
mySoccerNetDownloader.downloadDataTask(task="gamestate-2024",
split=["train", "valid", "test", "challenge"])
然后就可以看到正在下载了
5、回传文件
最后添加代码块
!cp -r folder_name /content/drive/MyDrive/其中 folder_name 是你要上传的文件夹名字
6、从谷歌网盘下载
点击左上角进入谷歌网盘,下载文件即可。